Análise de desempenho de Banco de Dados Relacionais e Não Relacionais em dados genômicos

نویسندگان

  • Juccelino Rodrigues Alves Barros
  • Gustavo Almeida Callou
  • Glauco Gonçalves
  • Victor Wanderley
  • Henrique Casteletti
چکیده

Nowadays, advancements in molecular technology brought better equipments to obtain more DNA sequences in less time, making storage of genomic data a great challenge. As a result, the amount of genomic data generated has been increasing in a way that sequencing a single organism can generate terabytes of information. In general, genomic data processing make use of simple files as the primary means for storing these data. However, modern databases are a good alternative for improved management of these data by offering better organization, fault tolerance, use of available memory for storage, and performance, as they are made in order to optimize these tasks. Additionally, databases allow adding meta-information about the stored DNA sequences. Considering such a scenario, this paper presents and evaluates the performance of different storage strategies in three databases that belong to two different paradigms, MySQL (which belongs to the Relational Database paradigm), Cassandra, and MongoDB (which belong to Non-Relational Database paradigm). The results show that relational databases have limitations to cope with large genomic data sets. Palavras-chave: Dados genômicos, banco de dados, banco de dados relacional, banco de dados não relacional.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

A Tecnologia Objeto-Relacional em Ambientes de Data Warehouse: Uso de Séries de Tempo como Tipo de Dado Não Convencional

Este artigo discute a utilização da tecnologia objeto-relacional (OR) em ambientes de Data Warehouse (DW). Em especial, apresenta uma análise sobre a viabilidade do uso de séries temporais como tipo de dado não convencional em um DW. A dimensão tempo é fundamental em qualquer DW, uma vez que estes sistemas têm por objetivo armazenar dados históricos derivados de diversos sistemas heterogêneos, ...

متن کامل

Análise Experimental de Bases de Dados Relacionais e NoSQL no Processamento de Consultas sobre Data Warehouse

Data warehouse (DW) is a large, oriented-subject, non-volatile, and historical database, and an important component of Business Intelligence. On DW are executed OLAP (Online Analytical Processing) queries that often culminate in a high response time. Fragmentation of data, materialized views and indices aim to improve performance in processing these queries. Additionally, NoSQL (Not only SQL) d...

متن کامل

Analisando o Desempenho de Banco de Dados Multi-Inquilino em Nuvem

Computação em nuvem é uma tendência de tecnologia com o objetivo de proporcionar serviços sob demanda de pagamento baseado no uso. Para melhorar a utilização dos recursos, os provedores implementam técnicas multi-inquilino para sistemas de banco de dados. Existem muitos modelos multi-inquilino, cada um com diferentes níveis de isolamento e desempenho. Entretanto, estes modelos não têm sido aval...

متن کامل

Uma Abordagem para Armazenamento de Dados Semi-Estruturados em Bancos de Dados Relacionais

This paper presents an approach to storing semistructured data in relational databases. We focus on semistructured data as extracted from Web pages by a tool called DEByE (Data Extraction By Example), and organized according to its data model, the DEByE Object Model (DEByE-OM). The approach presented here consists in representing the structure of objects extracted by DEByE by a relational schem...

متن کامل

Uma Análise Comparativa entre Sistemas Gerenciadores de Bancos de Dados NoSQL no contexto de Internet das Coisas

The search for improvement on applications performance is constant, especially in environments where data is analyzed in real time, as in Internet of Things (IoT). This paper aims to analyze the performance of nonrelational Database Management Systems (DBMS), inside the IoT context. To do so, three DBMS where analyzed with a benchmarkimg tool, using a real IoT dataset. The tests evaluated respo...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • RITA

دوره 24  شماره 

صفحات  -

تاریخ انتشار 2017